DepthKV: Poda de caché KV dependiente de la capa para inferencia de LLM de contexto largo DepthKV reduce el uso de memoria en LLMs de contexto largo mediante poda por capas del caché KV. Optimiza eficiencia sin perder precisión. 2026-04-28 · 2 min